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[ 摘 要 ] 简介 科研 数据 应 用 的 新 发 展 以 及 科研 数据 权益 管理 的 新 挑战 。 描 述 德国 国家 科技 图 书馆 的 可 
扩展 架构 以 及 其 中 的 科研 数据 入 口 网 站 GetInfo、 永 久 性 识别 服务 DOI、 全 球 性 数据 引用 服务 DataCite 等 的 实践 
成 果 ,并 讨论 培养 数据 馆 员 的 需求 。 这 些 服务 可 以 增强 对 非 文本 资源 的 检索 、 标 识 数字 数据 资源 、 促 使 科研 数 
据 得 到 正式 引用 以 及 提升 图 书馆 价值 。 

[ 关键 词 ] 数据 引用 “数字 资源 唯一 标识 符 
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科研 数据 集成 入 口 ”科研 数据 权益 与 管理 元 数据 框架 


色 ””。 

科学 信息 现在 不 仅仅 以 一 篇 文章 或 者 一 本 图 书 的 
形式 来 呈现 。 图 书馆 门户 网 站 可 以 整合 信息 并 且 提 供 
开发 服务 ,从 而 持续 作为 用 户 获取 信息 的 一 个 重要 
来 源 ” 。 

图 书馆 用 户 最 关心 的 是 能 否 在 查询 信息 后 获得 满 
意 答复 (无 论 他 查找 所 获得 的 信息 是 论文 .图 书 或 者 其 
他 形式 的 内 容 , 例 如 科研 数据 三 维 模型 图片、 视频 
等 ) 。 作 为 知识 和 信息 服务 的 提供 者 ,图 书馆 员 的 任务 
是 提供 用 户 服务 ,针对 他 们 的 提问 给 予 合适 的 科学 信 
息 作 为 最 为 理想 的 答复 。 如 果 图 书馆 界 想 要 持续 履行 
这 种 信息 供应 的 职责 ,就 得 释放 不 同形 式 内 容 的 书目 
数据 。 所 以 ,重点 在 于 : 


1 科技 信息 服务 的 挑战 与 未 来 图 书馆 


界 的 发 展 


科技 信息 越 来 越 庞大 复杂 ,而 且 逐 步 趋向 海量 数 
据 的 集成 。 尽 管 知识 传播 仍然 有 赖 于 科学 论文 的 形 
式 5 然 而 , 若 从 整体 的 科研 过 程 来 看 , 它 仅仅 是 科研 数 
握 父 理 流程 的 最 后 一 道 程序 。 
一 美国 国家 科学 基金 会 在 其 报告 (面向 21 世纪 探索 
的 网 路 基础 设施 ) 中 提 到 :“ 科 技 研究 和 教育 越 来 越 向 
数据 密集 型 的 方向 转变 :以 数字 技术 .仪器 仪表 和 各 种 
网 络 来 收集 .生成 .共享 和 分 析 数据 ,并 且 进 行 扩散 。 
使 属 界 范围 内 的 科学 家 和 工程 师 们 每 天 通过 实验 , 观 
察 和 模拟 ,进行 生产 获取、 分析 、 整 合 和 存储 T - bytes 
级 别 的 数字 数据 。 由 此 而 来 ,新 的 科学 方法 以 观察 和 
模 报 生成 数据 的 动态 整合 方式 ,智能 地 适应 不 断 变化 ne dn he 
的 条 件 , 从 而 揭 开 新 的 知识 "01 。 科 研 数据 应 用 的 办 新。 君 :针对 各 个 对 象 ,通过 各 闫 信息 , 尽 可 能 地 丰富 目 前 
发 展 以 及 科研 数据 权益 管理 的 全 新 挑战 ,引导 着 图 书 已 有 的 元 数据 ,以 满足 用 户 搜索 。 所 以 ,在 目录 中 与 关 
馆 界 迈 向 新 的 发 展 方向 。 键 词 相关 的 传统 搜索 方法 需要 扩展 成 为 能 够 满足 各 种 


微软 研究 院 的 开放 车 作 《第 四 范式 :数据 密集 型 科 
研 探索 》, 特 别 注意 到 科学 自身 如 何在 20 世纪 末 从 实 
证 主义 转向 数据 密集 。 科 学 传播 ,包括 同行 评审 ,也 在 
发 生根 本 性 的 变化 。 由 于 费用 、 时 效 以 及 把 实验 数据 
和 论文 文献 放 在 一 起 的 需求 等 ,数字 图 书馆 的 公共 共 
享 服务 将 会 全 面 代替 传统 图 书馆 在 收藏 出 版 物 上 的 角 


不 同 内 容 形式 的 新 型 搜索 方法 。 

。 需要 开发 资源 采购 和 建设 的 新 方法 ,使 之 成 为 
内 容 质量 的 保证 。 

。 参考 和 引用 的 支撑 能 力 ,是 记载 科学 内 容 的 出 
版 物 获得 永久 可 用 性 的 前 提 。 为 此 ,过 去 几 年 德国 国 
家 科技 图 书馆 (Gemeinsamen Bibliotheksverbund ,TIB ) 
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建立 了 DOI 注册 代理 以 及 相关 的 国际 协会 ( 即 
DataCite ) 。 

可 扩展 性 意味 着 图 书馆 能 够 直接 处 理 者 干 海量 信 
息 以 及 那些 传统 上 就 已 熟悉 的 内 容 载 体 ,但 是 不 必 自 
己 把 持 所 有 内 容 。 图 书馆 一 方面 要 考虑 到 存储 海量 大 
型 科研 数据 集 的 技术 要 求 ; 男 一 方面 要 考虑 到 专门 存 
储 和 维护 这 些 内 容 的 认证 机 制 和 措施 。 
图 书馆 目录 不 应 作为 纯粹 展示 自己 资源 的 窗口 ， 


201606.00026v1 


nn pe pen 
LE 00 “eh 二 22226595 
a YL nn 
,PP i pp 
a “rs 
oe 2 po pn 
wp no 


chinaXiv 


| 3 


团 定 情报 三 作 


第 57 卷 第 20 期 2013 年 10 月 


而 应 该 思考 将 之 发 展 成 为 一 种 分 布 式 延伸 内 容 的 门 
户 。 所 谓 “ 延 伸 内 容 ”, 是 指 类 似 大 数据 集 ,或 者 被 纺 
目的 视频 和 学 习 对 象 ,提供 与 用 户 的 研究 相关 的 匹配 
结果 。 读 者 在 顺利 访问 和 获取 内 容 后 ,通过 稳定 的 链 
接 ,还 可 以 延伸 触及 那些 受到 认证 的 专门 存储 有 关内 
容 的 档案 馆 和 数据 银行 。 

上 述 这 种 可 以 持续 深化 发 展 的 数字 图 书馆 架构 ， 
如 图 1 所 示 : 


图 1 持续 深化 发 展 的 图 书馆 入 口 网 站 ( 以 GetInfo 为 例 ) 


2 ”科研 数据 GetInfo 入 口 网 站 :案例 说 明 

德国 国家 科技 图 书馆 是 为 建筑 、 化 学 \ 信 息 计量 、 
数学 和 物理 等 专业 学 科 而 建立 的 国家 级 专业 图 书馆 。 
它 的 GetInfo 是 专 为 自然 科学 与 工程 专业 等 科研 信息 


而 建立 的 入 口 网 站 , 寺 插 先进 的 数据 银行 、 出 版 集成 商 
和 图 书馆 目录 的 访问 站 点 与 全 文 传递 集成 系统 。 在 
GetInfo 背后 是 TIB 所 提供 的 一 整套 科学 技术 专业 信息 
服务 。 
作为 欧洲 大 型 图 书馆 入 口 之 一 的 GetInfo 为 人 们 
提供 对 科研 数据 进行 访问 获取 的 服务 。 这 种 新 型 内 容 
的 服务 包括 两 种 途径 : 
e 在 GetInfo 和 联合 目录 ( Gemeinsamen 


Bibliotheksverbund,GBV) 中 进行 检索 。 用 户 寻 找 特定 主 
题 的 信息 时 ,通常 会 对 某 些 科学 家 所 收集 的 数据 集 感 
兴趣 。 他 们 可 以 直接 使 用 永久 标识 符 ( 这 里 指 的 是 
DOI 数字 资源 唯一 标识 符 ) ,在 图 书馆 目录 上 直接 看 到 
作为 独立 对 象 的 科研 数据 。 

在 GetInfo 所 显示 的 搜索 结果 之 中 ,科研 数据 位 居 
中 央 。 经 过 解析 永久 识别 符 , 人 们 能 在 页 面 上 从 元 数 
据 看 到 数据 中 心 , 从 数据 中 心 获 得 数据 集 ,这 就 像 下 载 
某 条 记录 或 者 整个 数据 的 链接 一 样 。 这 套 工 作 流 程 遵 
守 DOI 在 科学 期 刊 上 的 利用 方式 与 功能 效果 。 

。 科研 数据 的 可 视 化 。 在 GetInfo 上 提供 类 似 地 
质 科 研 数据 的 可 视 地 图 。 用 户 在 GetInfo 解 开 DOI 域 
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名 后 ,可 以 进入 如 PANGAFEA (盘古 大 地 ) 这 样 的 地 质 
数据 中 心 的 网 页 ,进入 数据 中 心 开 始 访问 数据 。 
3 ”科学 数据 的 永久 标识 :DOI 服务 

整合 出 版 物 的 数据 是 科学 合作 的 一 个 重要 组 成 部 
分 , 它 允 许 科研 成 果 接 受 检验 而 且 还 能 积极 地 交流 科 
研 知 识 。 

尽管 科学 领域 普遍 认为 数据 应 为 跨 学 科 所 利用 ， 
然而 ,科学 社 群 认 识 到 目前 很 少 有 人 对 数据 预 处 理 、 相 
关 文 献 整理 、 确 保 数 据 质量 上 进行 额外 工作 。 

发 表 科 学 成 果 的 传统 形式 是 在 专业 期 刊 上 发 布 ， 
但 通常 没有 基础 数据 的 发 布 。 这 些 传统 出 版 进入 “ 引 
用 索引 ”后 ,使 得 科学 家 可 以 受到 绩效 评价 。 然 而 ,这 
套 索 引 到 目前 为 止 并 不 包括 发 布 数据 在 内 。 
_ 德国 科学 基金 会 (Deutsche Forschungsgemeinschaft ， 
DF) 委托 TIB 所 实行 的 《科研 数据 的 发 布 与 引用 》 项 
钱 清 划 , 已 经 成 功 地 测试 了 以 DOI 域名 和 URNs 注册 
的 是 础 设施 来 处 理科 学 数据 ”。 在 TIB 的 系统 中 已 经 
可 人 碾 看 到 取 自 地 理科 学 的 超过 650 000 条 记录 的 永久 
识别 符 。 
CO 〇 作为 识别 符 的 DOI 的 应 用 ,可 以 链接 一 篇 科学 论 
文 和 论文 所 分 析 的 科研 数据 。 文 章 和 数据 集 通过 他 们 
管 间 的 DOI 域名 ,能 够 共同 被 引用 。 这 种 引用 和 链接 
的 形式 所 提供 的 科研 数据 成 为 直接 指向 科学 论文 的 附 
加 要 据 ( supplementary data) 引用 模式 。 其 范例 如 下 : 
6， 附 加 数据 的 引用 标识 ; 
.= Kuhlmann, H. et al.〈2009 ) : Age models, iron 


intensity , magnetic susceptibility records and dry bulk 
diene of sediment cores from around the Canary Islands. 

PAMGEA, Bremen 

doi:10.1594/PANGAEA. 727522 

。 关联 到 相关 的 科研 论文 : 

Kuhlmann, Holger; Freudenthal, Tim; Helmke, 
Helge ( 2004 ) : 
paleoceanography off NW Africa during the last 40,000 


Peer; Meggers, Reconstruction of 
years: Influence of local and regional factors on sediment 
accumulation. In: Marine Geology, 207 (1 -4)，209 


一 224 
doi:10. 1016/j. margeo. 2004. 03. 017 


4 科学 数据 的 全 球 引 用 :DataCite 
基于 TIB 作为 DOI 注册 代理 者 处 理科 研 数据 的 经 


成 立 DataCite 国际 联盟 。 它 的 目标 是 :让 科学 家 在 互 
联网 上 访问 科研 数据 ,接受 科研 数据 作为 独立 而 且 受 
到 引用 的 科研 对 象 ,从 而 遵循 《优良 的 科学 实践 原 
则 》”。 已 有 来 自 10 个 国家 的 15 个 伙伴 共同 搭 起 
DataCite 的 屋顶 ,它们 是 :大 英 图 书馆 法国 科技 信息 中 
心 (Institute de 1” Information Scientifique et Technique, 
INIST) ,丹麦 科技 信息 中 心 .荷兰 的 Delft 工业 大 学 
书馆 、 加 拿 大 科学 技术 信息 中 心 ( Canada Institute for 
Scientific and Technical Information, CISTI ) .美国 能 源 
部 的 科技 信息 办 公 室 (Office of scientific and Technical 
Information in US Department of Energy, OSTI) .美国 加 
州 数字 图 书馆 .美国 普 渡 大 学 .澳大利亚 国家 数据 服务 
中 心 (Australian National Data Service ,ANDS ) .瑞典 
家 数据 服务 中 心 (Swedish National Data Service ,SND ) 
以 及 苏黎世 联邦 技术 学 院 。 德 国 合作 伙伴 来 自 TIB 的 
Goportis 伙伴 们 :德国 医学 中 央 图 书馆 (Deutsche 
Zentralbibliothek fir Medizin,ZB MED ) .德国 经 济 科 学 
图 书馆 以 及 莱 布 尼 兹 社会 科学 院 CESIS ( Leibniz - 
Institut fiir Sozialwissenschaften GESIS ) 。 

DataCite 自 成 立 以 来 就 将 自己 作为 数据 中 心 科学 
家 、 出 版 商 和 图 书馆 之 间 的 中 介 。 它 在 以 下 三 个 领域 
中 提供 服务 : 

。 DataCite 是 数字 资源 唯一 标识 符 (DOI) 的 官方 
注册 机 构 以 及 国际 DOI 基金 会 (IDF) 的 成 员 。 截 至 
2011 年 1 月 DataCite 已 为 超过 100 万 件数 字 对 象 进行 
了 DOI 名 称 注册 。 

。 DataCite 积极 发 展 标 准 规范 与 最 佳 实践 的 交流 
以 及 制定 工作 流程 ,所 以 在 DataCite 合作 伙伴 中 有 一 
个 工作 小 组 ,负责 与 这 个 社 群 交流 一 套 共 通 元 数据 架 
构 ,以 者 括 所 有 的 科研 数据 引用 信息 。DataCite 持续 
积极 参与 新 成 立 的 CODATA 数据 引用 标准 和 实践 的 
指导 组 (www. codata. org/taskgroups/TGdatacitation/ 
index. html) 的 工作 ,制定 有 关 科 研 数据 引用 的 建议 。 
不 断 与 出 版 商讨 论 合作 的 可 能 性 :用 建立 数据 引用 索 
引 来 误 励 研究 人 员 ,使 他 们 的 数据 可 用 。 

。 DataCite 注册 的 所 有 数据 , 自 2011 年 起 ,都 将 
集中 在 一 个 可 供 访问 的 中 央 元 数据 库 。 这 个 数据 库 的 
内 容 可 免费 使 用 ,并 且 可 通过 第 三 方 ,如 汤 森 路 透 的 
Web of Science 等 站 点 访问 获取 。 

所 有 这 些 活动 都 遵循 DataCite 的 创始 原则 :科学 
是 全 球 性 的 ,因此 它 需 要 一 个 全 球 范 围 的 伙伴 ;愿意 与 
其 他 全 球 化 机 构 , 如 出 版 商 等 ,共同 发 展 合适 的 标准 规 


验 , 众 多 科技 图 书馆 和 信息 中 心 在 2009 年 12 月 共同 
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动 在 他 们 的 若干 科研 领域 .图 书馆 和 资助 机 构 内 建立 [2] Hey T, Tansley S, Tolle K. The fourth paradigm: Data -intensive 
网 络 DataCite 得 益 于 许多 当地 科学 家 的 服务 举措 而 scientific discovery [ M ]. Redmond，WA: Microsoft Research, 


受到 当地 合作 机 构 伙伴 们 的 支持 。 2009: im 
【 译 者 注 :该 书 已 有 中 文 版 : 潘 教 峰 , 张晓林 ,等 译 . 第 四 范式 : 


5 面向 未 来 的 图 书 情报 工作 服务 数据 密集 型 科研 [M] 北 京 :科学 出 版 社 , 2012. 】 


[3] Inger S, Gardner T. How readers navigate to scholarly content 


在 图 书馆 目录 中 所 显示 的 各 种 内 容 , 将 对 图 书馆 [ OL]. [2013 - 03 - 08]. http://www. sic. ox14. com/ 
和 图 书馆 员 产 生 新 的 意义 “，。 高 校 与 专业 图 书馆 可 howrendersnavigatetoscholarly eontent, paf 
以 把 自己 作为 服务 设施 ,提升 大 学 或 者 科研 院 所 的 科 [4] Heery R, Lyon L. Research and advanced technology for digital 
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